已经广泛地研究了使用虹膜和围眼区域作为生物特征,主要是由于虹膜特征的奇异性以及当图像分辨率不足以提取虹膜信息时的奇异区域的使用。除了提供有关个人身份的信息外,还可以探索从这些特征提取的功能,以获得其他信息,例如个人的性别,药物使用的影响,隐形眼镜的使用,欺骗等。这项工作提出了对为眼部识别创建的数据库的调查,详细说明其协议以及如何获取其图像。我们还描述并讨论了最受欢迎的眼镜识别比赛(比赛),突出了所提交的算法,只使用Iris特征和融合虹膜和周边地区信息实现了最佳结果。最后,我们描述了一些相关工程,将深度学习技术应用于眼镜识别,并指出了新的挑战和未来方向。考虑到有大量的眼部数据库,并且每个人通常都设计用于特定问题,我们认为这项调查可以广泛概述眼部生物识别学中的挑战。
translated by 谷歌翻译
雨林在全球生态系统中起着重要作用。但是,由于几个原因,它们的重要区域正面临森林砍伐和退化。创建了各种政府和私人计划,以监视和警报遥感图像增加森林砍伐的增加,并使用不同的方式处理显着的生成数据。公民科学项目也可以用于实现相同的目标。公民科学由涉及非专业志愿者进行分析,收集数据和使用其计算资源的科学研究组成,并在科学方面取得进步,并提高公众对特定知识领域的问题的理解,例如天文学,化学,数学和物理学。从这个意义上讲,这项工作提出了一个名为Foresteyes的公民科学项目,该项目通过对遥感图像的分析和分类来使用志愿者的答案来监视雨林中的森林砍伐区域。为了评估这些答案的质量,使用来自巴西法律亚马逊的遥感图像启动了不同的活动/工作流程,并将其结果与亚马逊森林砍伐监测项目生产的官方地面图进行了比较。在这项工作中,在2013年和2016年围绕着Rond \^onia州的前两个工作流程收到了35,000美元以上的$ 383 $志愿者的答复,$ 2,050 $ 2,050 $在发布后仅两周半就创建了任务。对于其他四个工作流程,甚至封闭了同一区域(Rond \^onia)和不同的设置(例如,图像分割方法,图像分辨率和检测目标),他们收到了$ 51,035美元的志愿者的答案,从$ 281的志愿者收取的$ 3,358 $ $ 3,358 $任务。在执行的实验中...
translated by 谷歌翻译
目的:机器学习技术已广泛用于12铅心电图(ECG)分析。对于生理时间序列,基于领域知识的深度学习(DL)优势(FE)方法仍然是一个悬而未决的问题。此外,尚不清楚将DL与FE结合起来是否可以提高性能。方法:我们考虑了要解决这些研究差距的三个任务:心律不齐的诊断(多类 - 甲状腺素分类),房颤风险预测(二进制分类)和年龄估计(回归)。我们使用2.3m 12铅ECG录音的总体数据集来培训每个任务的以下模型:i)随机森林将FE作为输入作为经典的机器学习方法培训; ii)端到端DL模型; iii)Fe+DL的合并模型。结果:FE得出的结果与DL产生了可比的结果,同时需要较少的两个分类任务数据,并且对于回归任务而言,DL的表现优于DL。对于所有任务,将FE与DL合并并不能单独提高DL的性能。结论:我们发现,对于传统的12铅ECG诊断任务,DL并未对FE产生有意义的改进,而它显着改善了非传统回归任务。我们还发现,将FE与DL相结合并不能单独改善DL,这表明FE与DL学到的功能是多余的。意义:我们的发现提供了有关哪种机器学习策略和数据制度的重要建议,可以选择基于12 Lead ECG开发新机器学习模型的任务。
translated by 谷歌翻译
这项工作引入了针对神经网络稀疏的定向进化方法(DE)方法,其中参数与网络准确性的相关性是直接评估的,并且当暂定零零时对准确性产生最小效果的参数确实被归零。 DE方法避免了通过模仿自然世界中的进化来归零的所有可能候选参数集的潜在组合爆炸。 DE使用蒸馏件[5]。在这种情况下,原始网络是教师,并将学生神经网络发展为稀疏目标,同时保持教师和学生之间的差异很小。 DE在网络的每一层达到所需的稀疏水平后,在存活参数上使用多种量化替代方案,以找到其表示的最低数量的位置,并且可接受的准确性损失。介绍了一个程序,以找到每个稀疏层中量化水平的最佳分布。最终参数表示,适用于幸存的量化参数的最终无损编码。 DE使用MNIST,FashionMnist和Coco数据集用于代表性神经网络的样本中,并具有渐进式较大的网络。在可可数据集上训练的具有超过6000万个参数网络的80类Yolov3达到了90%的稀疏性,并正确识别和段,所有原始网络都使用4BIT参数量化的置信度超过80%的对象。 40倍至80倍的压缩。它尚未逃脱作者,可以嵌套来自不同方法的技术。一旦在DE的周期中确定了用于稀疏的最佳参数集,就可以使用标准的组合(如参数幅度幅度和Hessian近似值)制成对这些参数的一个子集的决定。
translated by 谷歌翻译
深度学习体系结构已在不同领域(例如医学,农业和安全)取得了有希望的结果。但是,由于培训过程中所需的大型收藏品,在许多实际应用中使用这些强大的技术变得具有挑战性。几项作品通过提出可以更少学习更多知识的策略,例如弱和半监督的学习方法来克服它来克服它。由于这些方法通常无法解决对对抗性例子的记忆和敏感性,因此本文介绍了三种深度度量学习方法与混音相结合,以实现不完整的监督场景。我们表明,在这种情况下,指标学习中的一些最新方法可能无法很好地工作。此外,所提出的方法在不同数据集中的表现优于大多数。
translated by 谷歌翻译
相对摄像头姿势估计,即使用在不同位置拍摄的一对图像来估算翻译和旋转向量,是增强现实和机器人技术系统中系统的重要组成部分。在本文中,我们使用独立于摄像机参数的暹罗体系结构提出了端到端的相对摄像头姿势估计网络。使用剑桥地标数据和四个单独的场景数据集和一个结合四个场景的数据集对网络进行培训。为了改善概括,我们提出了一种新颖的两阶段训练,以减轻超参数以平衡翻译和旋转损失量表的需求。将提出的方法与基于CNN的一阶段培训方法(例如RPNET和RCPNET)进行了比较,并证明了所提出的模型在Kings College,Old Hospital和St Marys上提出的翻译量估计提高了16.11%,28.88%和52.27%教堂场景分别。为了证明纹理不变性,我们使用生成的对抗网络研究了提出的方法的概括,将数据集扩展到不同场景样式,作为消融研究。此外,我们对网络预测和地面真相构成的异性线进行定性评估。
translated by 谷歌翻译
QNNVerifier是第一个用于验证神经网络实现的开源工具,以考虑其操作数的有限字长(即量化)。通过采用最先进的软件模型检查(SMC)技术来实现对量化的新颖支持。它将神经网络的实现基于可满足模数理论(SMT)来将神经网络的实现到一阶逻辑的可解除片段。通过给定硬件确定的精度,通过直接实现来表示固定和浮点操作的影响。此外,Qnnverifier允许指定定制安全性能,并使用不同的验证策略(增量和K-Incuction)和SMT求解器来验证所产生的模型。最后,QNNVerifier是第一个通过间隔分析和非线性激活功能的离散化来组合不变推论的工具,以加快级别验证神经网络的级数。 qnnverifier的视频呈现可在https://youtu.be/7jmgol41zty中获得
translated by 谷歌翻译
车辆分类是一台热电电脑视觉主题,研究从地面查看到顶视图。在遥感中,顶视图的使用允许了解城市模式,车辆集中,交通管理等。但是,在瞄准像素方面的分类时存在一些困难:(a)大多数车辆分类研究使用对象检测方法,并且最公开的数据集设计用于此任务,(b)创建实例分段数据集是费力的,并且(C )传统的实例分段方法由于对象很小,因此在此任务上执行此任务。因此,本研究目标是:(1)提出使用GIS软件的新型半监督迭代学习方法,(2)提出一种自由盒实例分割方法,(3)提供城市规模的车辆数据集。考虑的迭代学习程序:(1)标记少数车辆,(2)在这些样本上列车,(3)使用模型对整个图像进行分类,(4)将图像预测转换为多边形shapefile,(5 )纠正有错误的一些区域,并将其包含在培训数据中,(6)重复,直到结果令人满意。为了单独的情况,我们考虑了车辆内部和车辆边界,DL模型是U-Net,具有高效网络B7骨架。当移除边框时,车辆内部变为隔离,允许唯一的对象识别。要恢复已删除的1像素边框,我们提出了一种扩展每个预测的简单方法。结果显示与掩模-RCNN(IOU中67%的82%)相比的更好的像素 - 明智的指标。关于每个对象分析,整体准确性,精度和召回大于90%。该管道适用于任何遥感目标,对分段和生成数据集非常有效。
translated by 谷歌翻译
MARCO排名数据集已广泛用于培训IR任务的深度学习模型,在不同的零射击方案上实现了相当大的效果。但是,这种类型的资源是英语以外的语言的稀缺。在这项工作中,我们呈现MMARCO,MS Marco段落的多语言版本,该数据集包括使用机器翻译创建的13种语言。我们通过微调单语和多语言重新排名模型以及此数据集的密集多语言模型进行了评估。实验结果表明,在我们翻译的数据集上微调微调的多语言模型可以单独对原始英文版的模型进行微调的卓越效果。我们蒸馏的多语言RE-RANKER与非蒸馏模型具有竞争力,而参数较少的5.4倍。最后,我们展现了翻译质量和检索效果之间的正相关性,提供了证据,即翻译方法的改进可能导致多语言信息检索的改进。翻译的数据集和微调模型可在https://github.com/unicamp-dl/mmarco.git上获得。
translated by 谷歌翻译
一种有效的横向传输方法是在一种语言中微调在监督数据集上的双语或多语言模型,并以零拍方式在另一种语言上进行评估。在培训时间或推理时间翻译例子也是可行的替代方案。然而,存在与文献中很少有关的这些方法相关的成本。在这项工作中,我们在其有效性(例如,准确性),开发和部署成本方面分析交叉语言方法,以及推理时间的延迟。我们的三个任务的实验表明最好的交叉方法是高度任务依赖性的。最后,通过结合零射和翻译方法,我们在这项工作中使用的三个数据集中实现了最先进的。基于这些结果,我们对目标语言手动标记的培训数据有所了解。代码和翻译的数据集可在https://github.com/unicamp-dl/cross-lingsual-analysis上获得
translated by 谷歌翻译